Ejercicio de visualizacion de informacion con Pandas - Soluciones

Este es un pequenio ejercicio para revisar las diferentes graficas que nos permite generar Pandas.

  • NOTA: Utilizar el archivo df3 que se encuentra en la carpeta data

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
df3 = pd.read_csv('../data/df3')
%matplotlib inline
df3.plot.scatter(x='a',y='b',c='red',s=50

In [2]:
df3.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 500 entries, 0 to 499
Data columns (total 4 columns):
a    500 non-null float64
b    500 non-null float64
c    500 non-null float64
d    500 non-null float64
dtypes: float64(4)
memory usage: 15.7 KB

In [3]:
df3.head()


Out[3]:
a b c d
0 0.336272 0.325011 0.001020 0.401402
1 0.980265 0.831835 0.772288 0.076485
2 0.480387 0.686839 0.000575 0.746758
3 0.502106 0.305142 0.768608 0.654685
4 0.856602 0.171448 0.157971 0.321231

Recrea la siguiente grafica de puntos de b contra a.


In [5]:
df3.plot.scatter(x='a',y='b',c='red',s=50,figsize=(12,3))


Out[5]:
<matplotlib.axes._subplots.AxesSubplot at 0x11c403d30>

Crea un histograma de la columna 'a'.


In [6]:
df3['a'].plot.hist()


Out[6]:
<matplotlib.axes._subplots.AxesSubplot at 0x11c55ecc0>

Las graficas se ven muy bien, pero deseamos que se vean un poco mas profesional, asi que utiliza la hoja de estilo 'ggplot' y genera el histograma nuevamente, ademas investiga como agregar mas divisiones.


In [7]:
plt.style.use('ggplot')

In [8]:
df3['a'].plot.hist(alpha=0.5,bins=25)


Out[8]:
<matplotlib.axes._subplots.AxesSubplot at 0x11c72fba8>

Crea una grafica de cajas comparando las columnas 'a' y 'b'.


In [9]:
df3[['a','b']].plot.box()


Out[9]:
<matplotlib.axes._subplots.AxesSubplot at 0x11c8d22b0>

Crea una grafica kde plot de la columna 'd'


In [10]:
df3['d'].plot.kde()


Out[10]:
<matplotlib.axes._subplots.AxesSubplot at 0x11c99dda0>

Crea una grafica de area para todas las columnas, utilizando hasta 30 filas (tip: usar .loc).


In [13]:
df3.loc[0:30].plot.area(alpha=0.4)


Out[13]:
<matplotlib.axes._subplots.AxesSubplot at 0x11e8a05f8>

In [ ]: